home *** CD-ROM | disk | FTP | other *** search
/ SGI Developer Toolbox 6.1 / SGI Developer Toolbox 6.1 - Disc 4.iso / documents / RFC / rfc1557.txt < prev    next >
Text File  |  1994-08-01  |  9KB  |  284 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7. Network Working Group                                            U. Choi
  8. Request for Comments: 1557                                       K. Chon
  9. Category: Informational                                            KAIST
  10.                                                                  H. Park
  11.                                                      Solvit Chosun Media
  12.                                                            December 1993
  13.  
  14.  
  15.             Korean Character Encoding for Internet Messages
  16.  
  17. Status of this Memo
  18.  
  19.    This memo provides information for the Internet community.  This memo
  20.    does not specify an Internet standard of any kind.  Distribution of
  21.    this memo is unlimited.
  22.  
  23. Introduction
  24.  
  25.    This document describes the encoding method being used to represent
  26.    Korean characters in both header and body part of the Internet mail
  27.    messages [RFC822].  This encoding method was specified in 1991, and
  28.    has since then been used.  It has now widely being used in Korean IP
  29.    networks.
  30.  
  31.    This document also describes the name of the encoding method which is
  32.    to be used in order to match the message header and body format of
  33.    MIME [MIME1, MIME2].
  34.  
  35.    This document describes only the encoding method for plain text.
  36.    Other text subtypes, rich text and similar forms of text, are beyond
  37.    the scope of this document.
  38.  
  39. Description
  40.  
  41.    It is assumed that the starting code of the message is ASCII.  ASCII
  42.    and Korean characters can be distinguished by use of the shift
  43.    function.  For example, the code SO will alert us that the upcoming
  44.    bytes will be a Korean character as defined in KSC 5601.  To return
  45.    to ASCII the SI code is used.
  46.  
  47.    Therefore, the escape sequence, shift function and character set used
  48.    in a message are as follows:
  49.  
  50.            SO           KSC 5601
  51.            SI           ASCII
  52.            ESC $ ) C    Appears once in the beginning of a line
  53.                             before any appearance of SO characters.
  54.  
  55.  
  56.  
  57.  
  58. Choi, Chon & Park                                               [Page 1]
  59.  
  60. RFC 1557               Korean Character Encoding           December 1993
  61.  
  62.  
  63.    The KSC 5601 [KSC5601] character set that includes Hangul, Hanja
  64.    (Chinese ideographic characters), graphic and foreign characters,
  65.    etc., is two bytes long for each character.
  66.  
  67.    For more information about Korean character sets please refer to the
  68.    KSC 5601-1987 document.  Also, for more detailed information about
  69.    the escape sequence and the shift function you can look for the ISO
  70.    2022 [ISO2022] document.
  71.  
  72. Formal Syntax
  73.  
  74.    Where this document in its formal syntax does not agree with the
  75.    description part, priority should be given to the formal syntax of
  76.    the document.
  77.  
  78.    The notations used in this section of the document are according to
  79.    those used in STD 11, RFC 822 [RFC822] with the same meaning.
  80.  
  81.         * (asterisk) has the following meaning :
  82.              l*m "anything"
  83.  
  84.    The above means that "anything" has to be used at least l times and
  85.    at most m times.  Default values for l and m are 0 and infinitive,
  86.    respectively.
  87.  
  88.    body            = *e-line *1( designator *( e-line / h-line ))
  89.  
  90.    designator      = ESC "$" ")" "C"
  91.  
  92.    e-line          = *text CRLF
  93.  
  94.    h-line          = *text 1*( segment *text ) CRLF
  95.  
  96.  
  97.  
  98.  
  99.    segment         = SO 1*(one-of-94 one-of-94 SI
  100.  
  101.                                                ; ( Octal, Decimal.)
  102.  
  103.    ESC             = <ISO 2022 ESC, escape>    ; ( 33, 27.)
  104.  
  105.    SO              = <ASCII SO, shift out>     ; ( 16, 14.)
  106.  
  107.    SI              = <ASCII SI, shift in>      ; ( 17, 15.)
  108.  
  109.    SP              = <ASCII SP, space>         ; ( 40, 32.)
  110.  
  111.  
  112.  
  113.  
  114. Choi, Chon & Park                                               [Page 2]
  115.  
  116. RFC 1557               Korean Character Encoding           December 1993
  117.  
  118.  
  119.    one-of-94       = <any char in 94-char set> ; (41-176, 33.-126.)
  120.  
  121.    CHAR            = <any ASCII character>     ; ( 0-177, 0.-127.)
  122.  
  123.    text            = <any CHAR, including bare CR & bare LF, but NOT
  124.                       including CRLF, and not including ESC, SI, SO>
  125.  
  126. MIME and RFC 1522 Considerations
  127.  
  128.    The name to be used for the Hangul encoding scheme in the contents is
  129.    "ISO-2022-KR".  This name when used in MIME message form would be:
  130.  
  131.                 Content-Type: text/plain; charset=iso-2022-kr
  132.  
  133.    Since the Hangul encoding is done with 7 bit format in nature, the
  134.    Content-Transfer-Encoding-header does not need to be used. However,
  135.    while using the Hangul encoding, current Hangul message softwares
  136.    does not support Base64 or Quoted-Printable encoding applied on
  137.    already encoded Hangul messages.
  138.  
  139.    The Hangul encoded in the header part of the message is Korean EUC
  140.    [EUC-KR].  In the EUC-KR encoding, the bytes with 8th bit set will be
  141.    recognized as KSC-5601 characters.  To use Hangul in the header part,
  142.    according to the method proposed in RFC 1522, the encoded Hangul are
  143.    "B" or "Q" encoded. When doing so, the name to be used will be EUC-
  144.    KR.
  145.  
  146. Background Information
  147.  
  148.    The Hangul encoding system is based on the ISO 2022 [ISO2022]
  149.    environment according to its 4/4 announcement.  However, the Hangul
  150.    encoding does not include the announcement's escape sequence.
  151.  
  152.    The KSC 5601 used in this document is, in definition, identical to
  153.    the KSC 5601-1987, KSC 5601-1989 and KSC 5601-1992's 94x94 octet
  154.    definition.  Therefore, any revision that refers to KSC-5601 after
  155.    1992 is to be considered as having the same meaning.
  156.  
  157.    At present, the Hangul encoding system is based on the experience
  158.    acquired from the former widely used "N-Byte Hangul" among UNIX
  159.    users.  Actually, the encoding method, "N-Byte Hangul", using SO and
  160.    SI was the encoding method used in SDN before KSC 5601 was made a
  161.    national standard.
  162.  
  163.    This code is intended to be used for the information interchange of
  164.    Hangul messages; any other use of the code is not considered
  165.    appropriate.
  166.  
  167.  
  168.  
  169.  
  170. Choi, Chon & Park                                               [Page 3]
  171.  
  172. RFC 1557               Korean Character Encoding           December 1993
  173.  
  174.  
  175. References
  176.  
  177.    [ASCII] American National Standards Institute, "Coded character set
  178.            -- 7-bit American national standard code for information
  179.            interchange", ANSI X3.4-1968
  180.  
  181.    [ISO2022] International Organization for Standardization (ISO),
  182.              "Information processing -- ISO 7-bit and 8-bit coded
  183.              character sets -- Code extension techniques",
  184.              International Standard, 1986, Ref. No. ISO 2022-1986 (E).
  185.  
  186.    [KSC5601] Korea Industrial Standards Association, "Code for
  187.              Information Interchange (Hangul and Hanja)," Korean
  188.              Industrial Standard, 1987, Ref. No. KS C 5601-1987.
  189.  
  190.    [EUC-KR] Korea Industrial Standards Association, "Hangul Unix
  191.             Environment," Korean Industrial Standard, 1992, Ref. No.
  192.             KS C 5861-1992.
  193.  
  194.    [RFC822] Crocker, D., "Standard for the Format of ARPA Internet
  195.             Text Messages", STD 11, RFC 822, UDEL, August 1982.
  196.  
  197.    [MIME1] Borenstein, N., and N. Freed, "MIME (Multipurpose
  198.            Internet Mail Extensions): Part One: Mechanisms for
  199.            Specifying and Describing the Format of Internet Message
  200.            Bodies", RFC 1521, Bellcore, Innosoft, September 1993.
  201.  
  202.    [MIME2] Moore, K., "MIME (Multipurpose Internet Mail Extensions)
  203.            Part Two: Message Header Extensions for Non-ASCII Text",
  204.            RFC 1522, University of Tennessee, September 1993.
  205.  
  206. Security Considerations
  207.  
  208.    Security issues are not discussed in this memo.
  209.  
  210. Acknowledgments
  211.  
  212.    The authors wants to thank all the people who assisted in writing
  213.    this document.  In particular, we thank Erik von der Poel, Felix M.
  214.    Villarreal, Ienup Sung, Kyoung Namgoong, and Kyuho Kim.
  215.  
  216.  
  217.  
  218.  
  219.  
  220.  
  221.  
  222.  
  223.  
  224.  
  225.  
  226. Choi, Chon & Park                                               [Page 4]
  227.  
  228. RFC 1557               Korean Character Encoding           December 1993
  229.  
  230.  
  231. Authors' Addresses
  232.  
  233.    Uhhyung Choi
  234.    Korea Advanced Institute of Science and Technology
  235.    Department of Computer Science
  236.    Taejon, 305-701, Republic of Korea
  237.  
  238.    Phone: +82-42-869-8718
  239.    Fax: +82-42-869-3510
  240.    EMail: uhhyung@kaist.ac.kr
  241.  
  242.  
  243.    Kilnam Chon
  244.    Korea Advanced Institute of Science and Technology
  245.    Department of Computer Science
  246.    Taejon, 305-701, Republic of Korea
  247.  
  248.    Phone: +82-42-869-3514
  249.    Fax: +82-42-869-3510
  250.    EMail: chon@cosmos.kaist.ac.kr
  251.  
  252.  
  253.    Hyunje Park
  254.    Solvit Chosun Media, Inc.
  255.    748-16 Yeoksam-Dong, Kangnam-Gu
  256.    Seoul, 135-080, Republic of Korea
  257.  
  258.    Phone: +82-2-561-0361
  259.    Fax: +82-2-569-4847
  260.    EMail: hjpark@dino.media.co.kr
  261.  
  262.  
  263.  
  264.  
  265.  
  266.  
  267.  
  268.  
  269.  
  270.  
  271.  
  272.  
  273.  
  274.  
  275.  
  276.  
  277.  
  278.  
  279.  
  280.  
  281.  
  282. Choi, Chon & Park                                               [Page 5]
  283.  
  284.